查看原文
其他

协整分析和误差修正操作步骤, 程序和各种检验, 附上代码并通过示例进行解读!

时间序列研究小组 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于时间序列方法,1.时间序列分析的各种程序, 38页集结整理成文档,2.ARDL, ARIMA, VAR, (G)ARCH时间数据模型讲解及软件操作,3.R软件中的时间序列分析程序包纵览,4.时间序列分析的各种程序, 38页集结整理成文档,5.时间序列数据分析的思维导图一览, 金融经济学者必备工具,6.送书: 应用时间序列分析(经典),7.为啥时间序列模型比较难学?时间序列的正名路,8.面板数据单位根检验软件操作和解读全在这里,9.动态面板回归和软件操作,单位根和协整检验(Dynamic Panel Data),10.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,11.送书: 应用时间序列分析(经典),12.时间序列模型分解,季节调整分析基础,13.动态因子模型是什么, 又怎么去实现? 14.动态面板分位数估计怎么做?15.动态面板门槛回归程序公布, 使用方法介绍,16.把动态面板命令讲清楚了,对Stata的ado详尽解释,17.时间序列分析概览(今天的重点1),18.全面比较和概述运用机器学习模型进行时间序列预测的方法优劣!19.一文读懂“非平稳时间序列计量经济学分析”, 包括单位根检验, 结构突变检验等,20.中断时间序列分析ITSA是什么? 很流行的政策评估新范式!21.ARIMA时间序列模型的步骤, 程序和各种检验, 附上代码并通过示例进行解读22.ARCH及其扩展模型的操作步骤, 程序和各种检验, 附上代码并通过示例进行解读!

正文
背景知识:1.面板协整与误差修正模型的操作程序和讲解,2.时间序列中的协整检验和VECM,以及回归后的系列估计操作
在宏观经济计量分析中,Granger(1987)所提出的协整方法已成为了分析非平稳经济变量之间数量关系的最主要工具之一,且通过线性误差修正模型(ECM)刻画了经济变量之间的线性调整机制,这就是所谓的线性协整方法。随着经济理论的发展,尤其是交易成本和政策反应的经济分析中,传统的线性协整分析已不再是合适的分析方法,鉴于此Balk和Fomby(1997) 提出了所谓的阈值协整(Threshold Cointegration)方法,它刻画了经济变量之间的非线性调整机制。
在这里可以对打个比方,协整就像一个喝醉酒的人牵着一条狗,即使人和狗的距离有时近有时远,但两者的距离始终是不会超过绳子的长度,一旦人和狗的距离超过绳子的长度,则接下来在绳子的作用下,人和狗的距离将会被拉近。
长期均衡关系与协整
经济理论指出,某些经济变量间确实存在着长期均衡关系。这种均衡关系意味着经济系统不存在破坏均衡的内在机制。如果变量在某时刻受到干扰后偏离其长期均衡点,则均衡机制将会在下一期进行调整以使其重新回到均衡状态。
假设X 与Y 间的长期“均衡关系”由下式表现出来:Yt=a0+a1Xt+ut这样的话,如果上式提示了X 与Y 间的长期稳定的“均衡关系”,则意味着Y 对其均衡点的偏离从本质上说是“临时性”的。因此,一个重要的假设就是随机干扰项ut 必须是平稳序列。显然,如果ut 有随机性趋势(上升或下降),则会导致Y 对其均衡点的任何偏离都会被长期累积下来而不能被消除。随机干扰项ut 也被称为非均衡误差,它将在误差修正模型里面被引入作为解释变量。
如果X 与Y 是一阶单整序列,即I(1)序列,而ut 又是平稳序列,即I(0),则我们称变量X 与Y 是协整的,记为I(1,1),ut 不是平稳序列的话,则称为I(1,0)。而要是X 与Y 是I(2)序列的话,且ut 是平稳序列,则变量X 与Y 是(2,2)阶协整。
因此,如果两个变量都是单整变量,只有当它们的单整阶数相同时,才有可能协整。但如果是三个以上的变量,如果具有不同的单整阶数,则有可能经过线性组合构成低阶单整变量。
在现实的应用中,我们比较看重(d,d)阶协整这类协整关系,因为如果它们是(d,d)阶协整的,则它们之间存在着一个长期稳定的比例关系。应用:检验变量之间的协整关系,在建立变量之间的协整关系,在建立计量经济模型中是非常重要的。而且,从变量之间是否具有协整关系出发选择模型的变量,其数据基础是牢固的,其统计性质是优良的。
最先检验变量的协整关系的方法是两变量的Engle-Granger 检验,其方法是先对双变量进行回归估计得出结构方程,进而得出非均衡误差,这样要是检验出的非均衡误差是稳定序列的话,则可判断两变量是(d,d)协整。在检验非均衡误差是稳定序列过程中,其判断标准要根据变量协整的ADF 临界值来判断。对于多变量协整检验的方法与双变量的相类似。
最新发展的协整检验是Johansen 于1988 年,以及与Juselius 一起于1990年提出了一种基于向量自回归模型的多重协整检验方法,通常称为Johansen 检验,或JJ 检验。在stata 这个计量软件里面,其判断协整个数的vecrank 命令就是基于JJ 检验的。
误差修正模型
建立误差修正模型,需要首先对变量进行协整分析,以发现变量之间的协整关系,即长期均衡关系,并以这种关系构成误差修正项。然后建立短期模型,将误差修正项看做一个解释变量,连同其他反映短期波动的解释变量一起,建立短期模型,即误差修正模型。由此我们可以利用误差修正方程进行短期的预测。
优点:误差修正模型相对于上面的向量自回归,要是我们所分析的经济变量具有协整关系的话,那么向量自回归模型就会容易引起残差的序列相关问题。因为向量自回归模型一般为了平稳,都是采用变量的差分形式,则其差分方程如:
DY(t)=a1DX(t)+v(t),其中v(t)=u(t)-u(t-1)
另外一方面,向量自回归模型由于采用差分形式,则关于变量水平值的重要信息将会被忽略,这样的模型只表达了变量间的短期关系,并没有揭示长期关系。而采用误差修正模型则很好的避免了上述的两个问题了。也可参照经管百科的解释:误差修正模型
例子:下面我们将采用美国四个州Austin、Dallas、Houston 和SanAntonio 的月房价数据,其时间从1990 年1 月到2003 年的3 月,来对协整和误差修正模型在stata 的操作,加以说明。
程序:
use http://www.stata-press.com/data/r11/txhprice,clear
des
*-四个州房价的基本时序特征
tsset t
line austin dallas houston sa t
*--Part I-- Dallas v.s. Houston
*-------------------------------

* 二变量协整分析
line dallas houston t
* 若两地的房价差异过大,居民和相关资源会在两地迁移,从而使两地价格趋同,因此,可以认为达拉斯和休斯敦的房价存在协整关系
*-0 检验序列的平稳性
dfuller dallas
dfuller houston
* 为什么是平稳呢?
*直觉解释:在完全竞争市场中,当前的房价包含了所有信息,因此,我们无法预测明日房价的走势
 
*-1 检验滞后阶数
varsoc dallas houston
 
*-2 检验协整关系的个数
vecrank dallas houston, lag(2)
 
*-4 建立VECM(向量误差修正模型)
vec dallas houston, lag(2)
*预测
predict ce, ce
list t dallas houston ce
twoway (line dallas houston t,yaxis(1)) ///
(line ce t, yaxis(2)) ///
, yline(0,axis(2) lp(dash) lc(black*0.4))
 
*-5 冲击反应分析(脉冲响应分析)
irf create vec2, set(vec02) step(24)
* 正交冲击反应
irf graph oirf, impulse(dallas) response(houston)
irf graph oirf, impulse(houston) response(dallas)
* 累积正交冲击反应
irf graph coirf, impulse(dallas) response(houston)
irf graph coirf, impulse(houston) response(dallas)
误差修正模型的结果为:
D_dallas=-0.3039L1.ce1-0.1647LD.dallas-0.0998LD.houston+0.0056
D_houston=0.5027L1.ce1-0.0620LD.dallas-0.33328LD.houston+0.0034
ce1=dallas-0.8676houston-1.689
分析:
在D_dallas 方程中,L._ce1 = -0.3039 表明:若Dallas 的房价过高,它会向着Houston 的房价下调;在[D_houston]方程中,L._ce1 =0.5027 表明:若Dallas 的房价过高,Houston 的房价会追随之。而要是在[D_houston]方程中,L._ce1 = -0.5027 则表明:若Houston 的房价过高,它会向着Dalla 的房价下调
 
长期均衡关系:P_dallas =-1.69 - 0.868*P_houston

接下来的是多变量的协整和误差修正模型:
程序:
*------------------------------------
*--Part II austin dallas houston sa
*------------------------------------
* 多变量协整分析
use http://www.stata-press.com/data/r11/txhprice,clear
tsset t
line austin dallas houston sa t
 
*-0 检验平稳性
dfuller austin
dfuller sa
 
*-1 检验滞后阶数
varsoc dallas houston austin sa
 
*-2 检验协整关系的个数
vecrank dallas houston austin sa, lag(2)
vecrank dallas houston austin sa, lag(3) //为了稳妥起见
 
*-3 检验那些序列之间存在协整关系
johans dallas houston austin sa, lag(3)
* lrjtest 和wjtest 原假设:
* H0: 被检验变量无法进入协整关系

* LR test
lrjtest dallas
lrjtest houston
lrjtest austin
lrjtest sa
 
* Wald test
wjtest dallas
wjtest houston
wjtest austin
wjtest sa
* 因此,达拉斯、休斯敦和奥斯汀三个州的房价在协整关系中非常显著,而sa 州则不显著。

*-4 建立VECM(向量误差修正模型)
vec austin dallas houston, rank(2) lag(3)
vec dallas houston austin, rank(2) lag(3) noetable
 
*-5 冲击反因分析(脉冲响应分析)
irf create vec3, set(vec03) step(24)
irf graph oirf, impulse(dallas houston) response(austin)
irf graph oirf, impulse(dallas austin) response(houston)
irf graph oirf, impulse(houston) response(austin dallas)
 
*-6 一些相关的检验
*--s6.1 协整方程的稳定性检验--- 基于协整关系的拟合值,因为调整系数的统计推断非常依赖于协整关系的稳定性
vec austin dallas houston, rank(2) lag(5)
predict ce1, ce eq(#1)
predict ce2, ce eq(#2)
twoway line ce1 t
twoway line ce2 t
line ce1 ce2 t
line dallas houston austin t //1991 年前后,三州的房价较为“混乱”
wntestb ce1 //第一个协整关系的设定似乎并不好
wntestb ce2
dfuller ce1
dfuller ce2
corrgram ce2
 
*--s6.2 检验协整个数的设定是否正确
* VECM 中参数的统计推断的合理性依赖于两个条件:
* 1. 协整方程(关系)是稳定的;
* 2. 协整个数的确定是正确的;这可以通过vecrank 来决定
* vecstable 同时对这两个问题进行检验
* 思路:如果VECM 中有K个内生变量,r个协整关系,如果剩余的K-r 个特征根的模非常接近于1,就表明
* 协整方程不稳定,或其中还有另一个共同趋势,即,rank() 选项设定的数值过高
vec austin dallas houston, rank(2) lag(5)
vecstable, graph
 
*--s6.3 检验残差是否服从正态分布
* Johansen(1995,p.141) 由于VECM 采用MLE 估计,假设干扰项为i.i.d,且服从正态分布。虽然在大样本下,无须正态分布假设,但考虑到多数时间序列都较短,因此,多数学者还是会检验残差是否服从正态分布
vec austin dallas houston, rank(2) lag(5)
vecnorm
 
*--s6.4 检验残差序列是否存在序列相关
* VECM 的估计,统计推断和预测都假设干扰项不存在序列相关
qui vec austin dallas houston, rank(2) lag(3)
veclmar, mlag(5)
关于宏观计量:1.过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图,2.DSGE模型的参数估计, 宏观经济学的神经中枢,3.高级宏观经济学森林导游简图,4.宏观经济学的名词解释,你知道多少,5.建立“国家宏观经济计量模型”的若干建议,6.VAR宏观计量模型演进与发展,无方向确认推断更好,7.宏观计量的演进(Macroeconometrics)
关于VAR方法,1.R软件中的时间序列分析程序包纵览2.时间序列分析的各种程序, 38页集结整理成文档3.时间序列数据分析的思维导图一览, 金融经济学者必备工具4.送书: 应用时间序列分析(经典)5.为啥时间序列模型比较难学?时间序列的正名路6.时间序列中的协整检验和VECM,以及回归后的系列估计操作7.时间序列模型分解,季节调整分析基础8.空间和时间的计量,关注二位国人9.TVP-VAR时变参数VAR系列文献和估计程序10.向量自回归VAR模型操作指南针,为微观面板VAR铺基石11.VAR宏观计量模型演进与发展,无方向确认推断更好12.应用VAR模型时的15个注意点,总结得相当地道13.面板数据单位根检验软件操作和解读全在这里14.动态面板回归和软件操作,单位根和协整检验(Dynamic Panel Data)15.面板向量自回归PVAR是什么? 数据, 程序和解读一步到位16.ARDL, ARIMA, VAR, (G)ARCH时间数据模型讲解及软件操作17.动态因子模型是什么, 又怎么去实现?18.SVAR模型的起源、识别、估计与应用, 系统讲述19.平滑转移自回归模型(STAR)应用与在R软件的操作20.Copula函数21.GVAR, 全局VAR模型是什么?该如何用软件实现, 有哪些研究文献和最新进展!22.前沿: BVAR, 贝叶斯VAR是什么, 为什么需要, 软件怎么做, 如何解读呢?23.结构性面板VAR是什么? 如何实现PSVAR呢?怎么解读

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存